误差

机器学习这门学科所追求的目标:泛化误差最小---不要过拟合

  1. 训练误差 || 经验误差
    • 学习器在训练集上的误差
  2. 泛化误差
    • 学习器在新的(未来的)样本上的误差

拟合

  1. 过拟合
    • 把训练样本自身的一些特点当成了所有潜在样本都会具有的普遍性质
  2. 欠拟合
    • 对训练样本的一般性质尚未学好

学机器学习算法时候要记得问自己如下问题,以加深理解 1. 这个算法靠什么来缓解Overfitting? 2. 这种缓解策略什么时候失效?(什么时候不能用?)